ویرایشگر متن شریف: سامانۀ ویرایش و خطایابی املایی زبان فارسی
Authors
Abstract:
In this paper, we will introduce an intelligent system to edit and spell check Persian texts. The goal is editing and preprocessing Persian texts for natural language processing tasks. This system is based on an expandable and engineering approach and is composed of three subsystems: Persian text editor, spell checker and stemmer. These parts interact with each other to edit texts. To do this, the stemmer subsystem process each word in the text if the subsystem could not find a stem in the lexicon, the word will be recognized as an incorrect word. Then, the spell checker provides a list of suggestions to correct the wrong word. Subsequently, the editor subsystem edits the text based on the standards of the Academy of Persian Language and Literature. Our evaluation shows nearly 92%, 95% and 96% precision numbers for editor, stemmer and spell checker subsystems, respectively.
similar resources
ویرایش گر متن شریف: سامانۀ ویرایش و خطایابی املایی زبان فارسی
در مقالۀ حاضر سامانه ای هوشمند جهت ویرایش و خطایابی املایی متون فارسی معرفی شده است. هدف از طراحی و ایجاد این سامانه، ویرایش متون فارسی برای کاربردهای پردازش زبان طبیعی است. این سامانه بر مبنای یک رویکرد مهندسی قابل توسعه، از سه زیرسامانه تشکیل شده است: ویرایش گر متن فارسی معیار، خطایاب املایی خودکار زبان فارسی و ستاک یاب واژگان زبان فارسی. این سه بخش با یکدیگر در تعاملند؛ بدین شکل که ابتدا ستا...
full textتأملی در ویژگیهای زبانی و املایی نسخۀ خطی نخستین شرح کامل مثنوی به زبان فارسی در آسیای صغیر
زبان فارسی و فرهنگ ایران همواره مشتاقانی در جهان داشته است و بخشهایی مانند آناتولی و منطقۀ بالکان، بسیار از این زبان و فرهنگ تأثیر پذیرفتهاند. فارسیآموزی، نسخهبرداری آثار علمی و ادبی، ترجمه، تصحیح و شرح متون فارسی، وجود نسخههای خطی بیشمار از آثار کهن ایرانی در کتابخانههای بزرگ دنیا و توجه محققان و مصححان غیرایرانی به بازآفرینی این متون، نشانههایی از نفوذ فرهنگ ایرانی و زبان فارسی در جها...
full textسامانۀ رفع ابهام معنایی از حروف اضافه در زبان فارسی با استفاده از قالبهای معنایی
رفع ابهام معنایی از کلمات در بافت یکی از مهمترین چالشها در حوزۀ پردازش زبان طبیعی و زبانشناسی رایانشی است. در این میان حروف اضافه، بهخصوص در زبان فارسی، در پژوهشهای مربوط به رفع ابهام معنایی همواره نادیده انگاشته شدهاند. ازاینرو، پژوهش حاضر قصد دارد با ارائۀ الگوریتمی جدید مبتنی بر قالبهای معنایی، سامانهای قاعدهمند جهت رفع ابهام معنایی از حروف اضافه «از»، «در»، «با» و «تا» در زبان فار...
full textرویکردی انتقادی به سرفصلهای مربوط به نگارش و ویرایش در برنامة درسی دورة کارشناسی زبان و ادبیات فارسی
این پژوهش به بررسی کارآمدی سرفصل دروس «آیین نگارش و ویرایش» و «کارگاه ویراستاری (1) و (2)» در برنامة درسی مقطع کارشناسی زبان و ادبیات فارسی نظر دارد. این دروس در برنامة درسی مدّنظر جنبة کاربردی دارند و ضمن تقویت مهارتهای نویسندگی، فراگیر را برای پذیرش زمینههای شغلی در جامعه آماده میکنند. در پژوهش پیشِ رو این دروس با توجه به شاخصهای شورای برنامهریزی آموزش عالی بررسی میشوند. نتایج این بررسی ن...
full textMy Resources
Journal title
volume 12 issue 4
pages 43- 52
publication date 2016-03
By following a journal you will be notified via email when a new issue of this journal is published.
No Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023